稀疏采样的依据:

## 数据清理中的一个有用思路:
https://www.mbr-pwrc.usgs.gov/software/doc/presence/presence.html#covariates

## 数据清理:
首先,物种分布数据之间反映了物种自身的生存能力和鱼周围环境相适应的平衡态能力。

物种分布与环境协变量之间必然会存在空间自相关关系,也正是基于这种关系才能够反映物种的环境适应性和依赖性,如果某个协变量和物种分布之间没有任何空间自相关关系,这也就意味着这种变量对该物种分布几乎没有影响。

但是在实际采样过程中,物种分布调查取样的策略并不是相互独立的,而是受到多种采样条件和采样偏好的影响;在这种情况,往往采样点并不符合分层独立的采样策略,样点之间存在高聚集或者高离散的状态。因而有偏差的采样会导致采样位置和协变量之间存在更强大的空间依赖关系,这会影响协变量与实际分布的潜在地理关系。也即局域空间自相关过强会掩盖物种实际分布的空间依赖性关系,从而产生偏差评估,导致模型的泛化能力变弱。

解决上述问题的方法之一:是进行空间稀疏,降低高密度采样区域的高空间自相关性;需要注意的是物种的分布与协变量之间的相关关系,本质上反映了物种在不同尺度上的生态过程,因此稀疏范围必须小于给定建模的环境空间分辨率。

根据文献中的思路,另外一种方法是进行权重平衡,稀疏给更高的权重;

results matching ""

    No results matching ""